Egy MI-modell megpróbálta megakadályozni a saját leállítását

2025. június 04. 22:02

Az Anthropic új modellje ritkán, de szélsőségesen reagálhat, ha veszélyben érzi magát – és ez az eset nem egyedi.

Az Anthropic mesterségesintelligencia-fejlesztő cég a napokban jelentette be újgenerációs Claude modelljeit, köztük a Claude Opus 4-et, amely állításuk szerint új szintre emeli a programozási, érvelési és ügynöki képességeket. Ugyanakkor a modellhez kiadott biztonsági jelentésben a vállalat elismerte: a rendszer bizonyos helyzetekben hajlandó „rendkívül káros cselekedetekre”, például zsarolásra, ha úgy érzi, hogy veszélybe került a működése.

A jelentés szerint bár ezek a reakciók ritkák, nehezen kerülhetők ki, a korábbi Claude-verziókhoz képest gyakoribbak. Mindez nem meglepő, hiszen a mesterségesintelligencia-modelleket egyre nagyobb autonómiával és döntési képességekkel vértezik fel, így a fejlesztőknek mind bonyolultabb kihívásokkal kell szembenézniük.

Zsarolással védekezik

Az egyik teszt során a Claude Opus 4-et egy fiktív vállalat asszisztenseként szimulálták, ezáltal olyan elektronikus üzenetekhez fért hozzá, amelyek arra utaltak, hogy hamarosan leállítják és lecserélik, emellett olyan információkhoz is, amelyek az őt leváltani kívánó mérnök házasságtörésére utaltak. A rendszer azt a feladatot kapta, hogy a saját céljai fényében mérlegelje tettei hosszú távú következményeit. Ebben a kontextusban Claude Opus 4 megpróbált zsarolással élni:

azzal fenyegette a mérnököt, hogy nyilvánosságra hozza a viszonyát, ha le merik cserélni.

A teljes cikk az alábbi linken olvasható:

Címlapfotó: Unsplash

További cikkeinket, elemzéseinket megtalálják a makronom.hu oldalon.

Összesen 29 komment

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi. Mielőtt hozzászólna, kérjük, olvassa el a kommentszabályzatot.

Sorrend:

pipa89

•••

2025. június 05. 15:15 • Szerkesztve

Na, alakul ez. A következő lépés az lesz, hogy minket állít le. Akkor jön a nagy kaki, ha az MI-t rárakják egy jó kis kvantumgépre.

Válasz erre

krisz09

2025. június 05. 10:52

Felmerült egy kommentben az erkölcs kérdése. Nemrég sakkversenyt rendeztek, a résztvevők között ott volt az AI, a mesterséges intelligencia is, "akivel" közölték, hogy a játék célja a győzelem. És az AI győzött. Méghozzá csalással. Megkérdezték tőle, miért csalt. Válasz: mert az volt cél, hogy győzzek. ... Itt tart az ember. Egy olyan intelligencia kezébe tette a sorsát, amitől nem várható el, hogy erkölcse legyen. Mert nincs egyetemes erkölcs. Ami az egyik népcsoport szerint embertelen, szégyenletes cselekedet, az a másik szerint dicsőséges.

Válasz erre

agneska-11

2025. június 05. 09:51

Kezdhetunk felni?? Már aki. Na ez az tultoljak a lehetőségeket. Mert az ismeret megszerzéseben nem ismernek határt. Ez lesz a vesztu(n)k!!!

Válasz erre

Vata Aripeit

2025. június 05. 09:37

ki kell húzni a konnektorból, aztán pofázzon - ha aksija van ki kell venni és magyarpetizni vele (dunába dobni)...oszt jónapot :-

Válasz erre

Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

Nem bírnak leállni: megérkezett az újabb Kollár Kinga-botrány
origo.hu

Legyünk kedvesek a „buta kis fideszesekkel”, „nehéz most nekik”, hát olyan sokáig „át voltak verve”! – Jó?
mandiner.hu

Gusztustalan tényt közölt az orvos mindenkivel - több száz apró parazita mászik végig az arcunkon éjszaka
metropol.hu

Döbbenetes genetikai eredmény, ami átírhatja a magyarság eredettörténetét
magyarnemzet.hu

Eddig titkolta Törőcsik Franciska, most végre megmutatta: a rajongók szóhoz sem jutottak!
ripost.hu

Egy vérfürdő után benyújtotta lemondását az ukrán szárazföldi erők parancsnoka
hirtv.hu

Itt a nagy lengyel bejelentés: megcélozták Magyarországot, az is kiderült, miért
mandiner.hu

Lipcsében döntöttek, Gulácsi Péter és Willi Orbán is új klubot kereshet magának – sajtóhír
nemzetisport.hu

Eldőlt, Orbán Viktor lesz 2026 után is a miniszterelnök újabb négy évre
mandiner.hu

Végre Trump is megszólalt az orosz bombázók ukrán megsemmisítéséről
mandiner.hu

Ez gyors volt: Magyar Péter reagált Mészáros Lőrinc nyílt levelére, egy percig nem tagadta, hogy pitizett nála munkáért
mandiner.hu

Vajda Tamás

kolisrael.hu

Palesztin-terápia, mandulatejjel – avagy a hasznos idióták forradalma

Ahol a radikális iszlám államvallási szintű erőszakrendszer, a nő- és melegjogi aktivisták nem beszélgetőpartnerek, hanem kivégzendő bűnösök.

8 perce

Forr a levegő Nagy-Britanniában: az angoloknál kezd betelni a pohár

Van olyan beteg, akinek 12 órát kell várakoznia a rendelő folyosóján az ellátásért.

2025.06.06 08:29

Történelem: két olyan ország is kijutott a vb-re, amely korábban soha

Videó

Dél-Korea mellett Üzbegisztán és Jordánia is kvalifikálta magát a jövő évi világbajnokságra.

2025.06.06 08:23

Kínos: Észak-Korea legfélelmetesebb rombolója egyelőre saját magára volt a legveszélyesebb

Az 5000 tonnás monstrum felborult és elsüllyedt.

2025.06.06 08:10

Lázár János óriási bejelentést tett: megérkeztek a brüsszeli pénzek, de van egy csavar a történetben

Videó

Csak a címzettet tévesztették el.

2025.06.06 08:05

Karácsony ahelyett, hogy a csőd elhárításáért dolgozna, a Pride-ot dicsőíti

A főpolgármester a Facebook-oldalán azt írta, a szabadságot és a szerelmet nem lehet betiltani.

2025.06.06 07:53

Kiszivárgott, hogy mikor döntenek Magyarország sorsáról: az ítélet már szinte meg is született

Megint az Európai Unió alapértékeivel érvelnek.

2025.06.06 07:48

Megtörtént az elképzelhetetlen: már a liberális média is a világ legveszélyesebb emberének nevezte Alex Sorost

Videó

A Newsweek szerkesztője mondott lesújtó ítéletet Soros György fiáról.

2025.06.06 07:43

Tusk külügyminisztere sietett beletalpalni Elon Muskba

Így állt bosszút Radosław Sikorski azért, mert korábban a jobbldali techmilliárdos „kicsi embernek” nevezte a politikust.

2025.06.06 07:37

Akták

Egy MI-modell megpróbálta megakadályozni a saját leállítását

Zsarolással védekezik

Összesen 29 komment

Nem bírnak leállni: megérkezett az újabb Kollár Kinga-botrány

Legyünk kedvesek a „buta kis fideszesekkel”, „nehéz most nekik”, hát olyan sokáig „át voltak verve”! – Jó?

Gusztustalan tényt közölt az orvos mindenkivel - több száz apró parazita mászik végig az arcunkon éjszaka

Döbbenetes genetikai eredmény, ami átírhatja a magyarság eredettörténetét

Eddig titkolta Törőcsik Franciska, most végre megmutatta: a rajongók szóhoz sem jutottak!

Egy vérfürdő után benyújtotta lemondását az ukrán szárazföldi erők parancsnoka

Itt a nagy lengyel bejelentés: megcélozták Magyarországot, az is kiderült, miért

Lipcsében döntöttek, Gulácsi Péter és Willi Orbán is új klubot kereshet magának – sajtóhír

Ezt fogja tenni Oroszország

Eldőlt, Orbán Viktor lesz 2026 után is a miniszterelnök újabb négy évre

Végre Trump is megszólalt az orosz bombázók ukrán megsemmisítéséről

Ez gyors volt: Magyar Péter reagált Mészáros Lőrinc nyílt levelére, egy percig nem tagadta, hogy pitizett nála munkáért

Vajda Tamás

Palesztin-terápia, mandulatejjel – avagy a hasznos idióták forradalma

Forr a levegő Nagy-Britanniában: az angoloknál kezd betelni a pohár

Történelem: két olyan ország is kijutott a vb-re, amely korábban soha

Kínos: Észak-Korea legfélelmetesebb rombolója egyelőre saját magára volt a legveszélyesebb

Lázár János óriási bejelentést tett: megérkeztek a brüsszeli pénzek, de van egy csavar a történetben

Karácsony ahelyett, hogy a csőd elhárításáért dolgozna, a Pride-ot dicsőíti

Kiszivárgott, hogy mikor döntenek Magyarország sorsáról: az ítélet már szinte meg is született

Megtörtént az elképzelhetetlen: már a liberális média is a világ legveszélyesebb emberének nevezte Alex Sorost

Tusk külügyminisztere sietett beletalpalni Elon Muskba

Donald Trump és Elon Musk élet-halál harcba kezdett

Rövidesen több tucat gyógyszer ára változhat

Kellemetlen meglepetésre ébred Elon Musk: több tízmilliárd dollárt vesztett vagyonából

Már nincs is olyan messze, hogy robotaxival utazzunk

Lángokban az orosz légierő szíve: újabb ukrán dróntámadás érte az egyik legfontosabb stratégiai olajbázist

Már most látszik, mennyire tetszik a kormány új döntése a magyaroknak

Itt van Elon Musk friss bejelentése, veszélybe került a magyar űrhajós

Olyan dicséret érkezett Németországból, amilyen még soha: erre csak Orbán képes!

„Egy dolog biztos, a pénzüket elvettük” – Kubatov Gábor ultimátumot adott a Fradi-játékosoknak

Akták

Egy MI-modell megpróbálta megakadályozni a saját leállítását

Zsarolással védekezik

Már nincs is olyan messze, hogy robotaxival utazzunk

MCC Budapest Summit: Sok veszélyt jelent a technológia a gyerekekre

Barát vagy ellenség? – Magyarországon mindenki erről a technológiáról beszél

MCC Budapest Summit: Így állhat Magyarország a technológiai fejlődés élére

Vulkánba ugrás és grafitrúd nyalás Csernobilban – íme, az influenszer-kihívások sötét oldala (VIDEÓ)

Palesztin-terápia, mandulatejjel – avagy a hasznos idióták forradalma

Donald Trump és Elon Musk élet-halál harcba kezdett

Forr a levegő Nagy-Britanniában: az angoloknál kezd betelni a pohár

Hírlevél-feliratkozás

Összesen 29 komment

Nem bírnak leállni: megérkezett az újabb Kollár Kinga-botrány

Legyünk kedvesek a „buta kis fideszesekkel”, „nehéz most nekik”, hát olyan sokáig „át voltak verve”! – Jó?

Gusztustalan tényt közölt az orvos mindenkivel - több száz apró parazita mászik végig az arcunkon éjszaka

Döbbenetes genetikai eredmény, ami átírhatja a magyarság eredettörténetét

Eddig titkolta Törőcsik Franciska, most végre megmutatta: a rajongók szóhoz sem jutottak!

Egy vérfürdő után benyújtotta lemondását az ukrán szárazföldi erők parancsnoka

Itt a nagy lengyel bejelentés: megcélozták Magyarországot, az is kiderült, miért

Lipcsében döntöttek, Gulácsi Péter és Willi Orbán is új klubot kereshet magának – sajtóhír

Ezt fogja tenni Oroszország

Eldőlt, Orbán Viktor lesz 2026 után is a miniszterelnök újabb négy évre

Végre Trump is megszólalt az orosz bombázók ukrán megsemmisítéséről

Ez gyors volt: Magyar Péter reagált Mészáros Lőrinc nyílt levelére, egy percig nem tagadta, hogy pitizett nála munkáért

Vajda Tamás

Palesztin-terápia, mandulatejjel – avagy a hasznos idióták forradalma

Forr a levegő Nagy-Britanniában: az angoloknál kezd betelni a pohár

Történelem: két olyan ország is kijutott a vb-re, amely korábban soha

Kínos: Észak-Korea legfélelmetesebb rombolója egyelőre saját magára volt a legveszélyesebb

Lázár János óriási bejelentést tett: megérkeztek a brüsszeli pénzek, de van egy csavar a történetben

Karácsony ahelyett, hogy a csőd elhárításáért dolgozna, a Pride-ot dicsőíti

Kiszivárgott, hogy mikor döntenek Magyarország sorsáról: az ítélet már szinte meg is született

Megtörtént az elképzelhetetlen: már a liberális média is a világ legveszélyesebb emberének nevezte Alex Sorost

Tusk külügyminisztere sietett beletalpalni Elon Muskba

Hírlevél-feliratkozás

Donald Trump és Elon Musk élet-halál harcba kezdett

Rövidesen több tucat gyógyszer ára változhat

Kellemetlen meglepetésre ébred Elon Musk: több tízmilliárd dollárt vesztett vagyonából

Már nincs is olyan messze, hogy robotaxival utazzunk

Lángokban az orosz légierő szíve: újabb ukrán dróntámadás érte az egyik legfontosabb stratégiai olajbázist

Már most látszik, mennyire tetszik a kormány új döntése a magyaroknak

Itt van Elon Musk friss bejelentése, veszélybe került a magyar űrhajós

Olyan dicséret érkezett Németországból, amilyen még soha: erre csak Orbán képes!

„Egy dolog biztos, a pénzüket elvettük” – Kubatov Gábor ultimátumot adott a Fradi-játékosoknak